多目标高维运动优化问题在机器人技术中无处不在,并且信息丰富的梯度受益。为此,我们要求所有成本函数都可以微分。我们建议学习任务空间,数据驱动的成本功能作为扩散模型。扩散模型代表表达性的多模式分布,并在整个空间中表现出适当的梯度。我们通过将学习的成本功能与单个目标功能中的其他潜在学到的或手工调整的成本相结合,并通过梯度下降共同优化所有这些属性来优化运动。我们在一组复杂的掌握和运动计划问题中展示了联合优化的好处,并与将掌握的掌握选择与运动优化相提并论相比。
translated by 谷歌翻译
在本文中,我们关注将基于能量的模型(EBM)作为运动优化的指导先验的问题。 EBM是一组神经网络,可以用合适的能量函数参数为参数的GIBBS分布来表示表达概率密度分布。由于其隐含性,它们可以轻松地作为优化因素或运动优化问题中的初始采样分布整合在一起,从而使它们成为良好的候选者,以将数据驱动的先验集成在运动优化问题中。在这项工作中,我们提出了一组所需的建模和算法选择,以使EBMS适应运动优化。我们调查了将其他正规化器在学习EBM中的好处,以将它们与基于梯度的优化器一起使用,并提供一组EBM架构,以学习用于操纵任务的可通用分布。我们提出了多种情况,可以将EBM集成以进行运动优化,并评估学到的EBM的性能,以指导模拟和真实机器人实验的指导先验。
translated by 谷歌翻译
灵巧的操纵仍然是机器人技术中的一个空缺问题。为了协调研究界为解决这个问题的努力,我们提出了共同的基准。我们设计和构建了机器人平台,该平台托管在MPI上供智能系统托管,可以远程访问。每个平台由三个能够敏捷物体操纵的机器人手指组成。用户能够通过提交自动执行的代码(类似于计算群集)来远程控制平台。使用此设置,i)我们举办机器人竞赛,来自世界任何地方的团队访问我们的平台以应对具有挑战性的任务ii)我们发布了在这些比赛中收集的数据集(包括数百个机器人小时),而我们为研究人员提供了访问自己项目的这些平台。
translated by 谷歌翻译
Dexterous操作是机器人中的一个具有挑战性和重要问题。虽然数据驱动方法是一个有希望的方法,但由于流行方法的样本效率低,当前基准测试需要模拟或广泛的工程支持。我们为Trifinger系统提供基准,这是一个开源机器人平台,用于灵巧操纵和2020年真正的机器人挑战的重点。在挑战中取得成功的基准方法可以一般被描述为结构性政策,因为它们结合了经典机器人和现代政策优化的元素。这种诱导偏差的包含促进样品效率,可解释性,可靠性和高性能。该基准测试的关键方面是验证跨模拟和实际系统的基线,对每个解决方案的核心特征进行彻底消融研究,以及作为操纵基准的挑战的回顾性分析。本工作的代码和演示视频可以在我们的网站上找到(https://sites.google.com/view/benchmark-rrc)。
translated by 谷歌翻译
由于新的数据智能技术,仓库管理系统一直在不断发展和改进。但是,许多当前的优化已应用于特定情况,或者非常需要手动相互作用。这是强化学习技术发挥作用的地方,提供自动化和适应当前优化政策的能力。在本文中,我们介绍了一个可自定义的环境,它概括了用于强化学习的仓库模拟的定义。我们还验证了这种环境,以防止最新的增强学习算法,并将这些结果与人类和随机政策进行比较。
translated by 谷歌翻译
在行业中,深度神经网络显示出高缺陷检测率,超过了其他基于手动特征工程的其他更为传统的建议。这主要是通过监督培训来实现的,在该培训中,需要大量数据才能学习良好的分类模型。但是,在工业场景中,有时很难获得这样的数据,因为通常会产生有缺陷的零件。此外,某些类型的缺陷非常罕见,通常只是不时出现,这使得生成适当的数据集来训练分类模型。此外,缺乏可用数据将检查模型的适应性限制为出现在生产中的新缺陷类型,因为它可能需要进行模型再培训才能合并检测并检测到它们。在这项工作中,我们在太阳能电池质量检查的背景下探索了重量印记的技术,在该方面,我们已经在三个基本缺陷类别上训练了网络,然后我们使用了很少的样本合并了新的缺陷类。结果表明,该技术使网络可以扩展其关于几个样本的缺陷类别的知识,这对于工业从业者来说可能很有趣。
translated by 谷歌翻译